Détection de clusters spatiaux sans point source prédéfini : utilisation de cinq méthodes et comparaison de leurs résultats - 02/03/08
J. Gaudart [1],
R. Giorgi [2],
B. Poudiougou [3],
O. Touré [3],
S. Ranque [4],
O. Doumbo [3],
J. Demongeot [5]
Voir les affiliationspages | 10 |
Iconographies | 6 |
Vidéos | 0 |
Autres | 0 |
Résumé |
Position du problème |
Différentes méthodes statistiques ont été développées pour décrire l'hétérogénéité spatiale, en termes de zone à haut risque. En l'absence de source prédéterminée, cette hétérogénéité peut être décrite de façon globale ou locale. Les méthodes globales testent une statistique estimée sur l'ensemble de la zone géographique étudiée, alors que les méthodes locales estiment une statistique sur chaque unité spatiale (ou regroupement d'unités). Notre objectif est de présenter cinq méthodes de détection de cluster, et de comparer les résultats d'une application épidémiologique.
Méthodes |
Les deux méthodes globales étudiées étaient : 1) le coefficient de Moran, coefficient d'autocorrélation classiquement utilisé ; 2) la statistique de Tango, généralisation spatiale de la statistique du Chi2. Les trois méthodes de détection locale étudiées étaient : 1) l'application locale du coefficient de Moran, introduite par Anselin ; 2) la méthode de balayage, qui recherche des regroupements d'unités spatiales ; 3) l'arbre de régression oblique, qui découpe la zone d'étude en sous-zones de risques différents. Les cinq méthodes ont été appliquées à la description de l'hétérogénéité spatiale du risque palustre dans un village hyperendémique, au Mali.
Résultats |
Toutes les méthodes ont mis en évidence une hétérogénéité spatiale significative. Les méthodes globales (coefficient de Moran et statistique de Tango) ont montré des corrélations spatiales faibles. Le coefficient local de Moran a détecté cinq unités spatiales (après ajustement de Bonferroni). La méthode de balayage a détecté un seul cluster à risque. L'arbre de régression oblique a découpé la zone géographique en six sous-zones dont la sous-zone à plus haut risque correspond au cluster issu de la méthode de balayage.
Conclusion |
Les méthodes présentées peuvent être utilisées en absence de connaissance, a priori, d'une source. Elles évaluent l'hétérogénéité spatiale du risque sur l'ensemble de la zone étudiée. Cependant, la forme, la taille des régions ainsi que le caractère global ou local de l'hétérogénéité spatiale et la définition de la proximité influencent les résultats et leur interprétation. Bien que l'interprétation des résultats doive être faite avec précaution, ces méthodes peuvent être utilisées pour une étude préliminaire ou dans le cadre de la surveillance épidémiologique.
Abstract |
Background |
Various statistical methods have been developed to describe spatial heterogeneity, in terms of high risk zones. If no source can be determined, this heterogeneity can be globally or locally described. Global methods test a statistic estimated over the whole studied geographical area, whereas local methods estimate a statistic on each spatial unit (or regrouping unit). This paper aimed to present, and to compare results of an epidemiological application, of five methods of spatial cluster detection.
Methods |
The two global detection methods were: 1) Moran's coefficient, a classically used autocorrelation coefficient; 2) Tango's statistic, a spatial generalization of the Chi2 statistic. The three local methods were: 1) the local application of Moran's coefficient, proposed by Anselin; 2) the scan statistic, which searches for grouping of spatial units; 3) the oblique regression tree, which splits the studied zone into sub-zones of different risks.
These five methods were applied to the description of the spatial heterogeneity of the malaria risk over a hyperendemic village, in Mali.
Results |
All the methods highlighted a significant spatial heterogeneity. Both global methods (Moran's coefficient and Tango's statistic) showed weak spatial correlations. Local Moran's coefficient (with Bonferronis' adjustment) highlighted five spatial units. The scan statistic identified a single high risk cluster. The regression oblique tree split the study area into six sub-zones; the sub-zone with the higher risk was consistent with the cluster identified by the scan statistic.
Conclusion |
These presented methods do not require any previous knowledge of a source. They allow evaluating spatial risk heterogeneity over the entire geographical area under study. It is noteworthy that shape, size, and spatial heterogeneity characteristics (either global or local) of the study area, as well as the definition of the proximity, significantly influence the spatial risk analysis' outcome. Although their results should be cautiously interpreted, these methods are useful for preliminary field studies or epidemiological surveys.
Mots clés :
Épidémiologie géographique
,
Détection de clusters
,
Autocorrélations spatiales
,
Structure spatiale
,
Arbres de régression
,
Statistique de balayage spatial
,
Tests globaux et locaux
Keywords: Geographical epidemiology , Cluster detection , Spatial autocorrelations , Spatial patterns , Regression trees , Spatial scan statistic , Global and local tests
Plan
© 2007 Elsevier Masson SAS. Tous droits réservés.
Vol 55 - N° 4
P. 297-306 - août 2007 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.
Déjà abonné à cette revue ?